Логин
 
 
 
 

Статьи и обзоры



 
 
XI Форум Auto-ID & Mobility - решения для бизнеса

Smart Engines научилась распознавать рукописную “шиншиллу” из мемов про русский курсив

21.03.2025

Сложность задачи обусловлена тем, что при быстром и не очень аккуратном письме строчные формы букв “ш”, “л”, “и” становятся практически неразличимы

Ученые компании Smart Engines обучили ИИ распознавать трудночитаемые рукописные слова, такие как “шиншилла”, без языкового контекста. Новая нейросеть не использует знаний о словах русского языка и учитывает только особенности сопряжения букв на изображении. Такой подход кардинально снижает вероятность галлюцинаций ИИ на редко встречающихся словах, включая имена собственные. Эта разработка вывела на новый уровень системы распознавания паспортов РФ, которые используются ведущими банками, сотовыми операторами и другими российскими компаниями.

Слово “Шиншилла” – своеобразный тест Тьюринга для систем распознавания рукописного текста на кириллице. Сложность задачи обусловлена тем, что при быстром и не очень аккуратном письме строчные формы букв “ш”, “л”, “и” становятся практически неразличимы. По этой причине слово “шиншилла” неоднократно упоминалось в мемах про сложность русского языка.

Нейросетевая архитектура «Да Винчи» не использует лингвистические механизмы — рекуррентные схемы, триграммы и словари. За счет этого она работает быстрее аналогов и занимает меньше места в памяти устройства. Но даже это не гарантирует переобучения языковому контексту. Для радикального сокращения риска галлюцинаций «Да Винчи» обучена на 1,2 млн строк рукописного текста, синтезированного с равномерным распределением сочетаний букв.

“Основной целью было создать метод ИИ, который умел бы читать такие сложные для прочтения рукописные слова, как «шиншила», но без использования языкового контекста. Это необходимо для распознавания документов - паспортов, штампов о регистрации и других. В них надо читать ровно то, что написано, а не то, что правильно с точки зрения языка”, – комментирует генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.

Выход новой технологии приурочен к десятилетию выпуска первой системы распознавания паспорта РФ в видеопотоке на смартфоне. 17 марта 2015 года ученые Smart Engines первыми в мире реализовали возможность распознавания страниц основного разворота паспорта на мобильном телефоне в видеопотоке в режиме реального времени. Целевыми моделями в то время были iPhone 4S и Samsung Galaxy S3.

Подписывайтесь на наши новости в Telegram: https://t.me/idexpert

Читайте нас на VK: https://vk.com/idexpert_ru

Источник:  Пресс-служба Smart Engines


Рейтинг статьи

Возврат к списку



Материалы по теме:

Статьи и обзоры
Новости рынка и технологий

Продукты автоматической идентификации

UHF RFID метка CandyTag
UHF RFID метка CandyTag
UHF RFID-метка для маркировки товаров для производственных и логистических нужд
Chainway UR4
Chainway UR4
4-портовый стационарный UHF RFID считыватель
Тау Платформа
Тау Платформа
Кроссплатформенное решение для быстрой разработки мобильных и десктоп приложений
DASCOM DC-7600
DASCOM DC-7600
Карточный принтер с технологией ретрансферной печати
DASCOM DC-2300
DASCOM DC-2300
Компактный принтер для печати карт с технологией прямой термопечати
Chainway C72 UHF RFID
Chainway C72 UHF RFID
Мобильный UHF RFID считыватель на ОС Android
Chainway C66 UHF
Chainway C66 UHF
Надежный мобильный компьютер со встроенным RFID модулем
DASCOM DC-240
DASCOM DC-240
Карточный принтер с технологией прямой термопечати
RST-BOOKOS
RST-BOOKOS
Настольный UHF RFID считыватель для библиотек, предприятий и складов

Все продукты >>>

 
XI Форум Auto-ID & Mobility - решения для бизнеса

Проекты и решения

События

Опрос





Комментарии